کاربرد یادگیری تقویتی در یک مدلسازی عاملمحور برای بازار عمدهفروشی برق ایران
Authors
Abstract:
مطالعات اخیر بازارهای عمدهفروشی برق عموماً براساس مدلهای چندعاملی است، که در آنها تعادل بازار برپایه رقابت و تعامل عوامل متعدد با یک دیگر به دست میآید. از ویژگیهای اصلی این نوع مدلها، امکان یادگیری عوامل از نتایج رفتار خود و سایرین دریک محیط رقابتی است. در بازار عمدهفروشی برق، هرعامل یک واحد تولیدکننده برق است که به صورت مستقل و هوشمند با سایر عاملها برای عرضه برق با قیمتهای پیشنهادی رقابت میکند. فرآیند قیمتگذاری را میتوان یک بازی ایستا فرض نمود که هرروز تکرار میشود. در این بازی هر عامل قیمت پیشنهادی خود را مستقلا اعلام نموده و بهرهبردار با توجه به تقاضای بار مصرفی و محدودیتها، بهترین پیشنهادها را انتخاب مینماید. عامل به صورت عقلائی عمل نموده و با انتخاب استراتژی مناسب، به دنبال بیشینه نمودن سود بلندمدت خود است. در این راستا، عامل از قدرت یادگیری و بهبود استراتژی قیمتگذاری، که نقش بسیار تعیین کننده در موفقیت عامل دارد، استفاده میکند. یادگیری تقویتی یک روش کلاسیک است که در مدلهای چندعاملی امکان یادگیری مبتنی بر سعی و خطا را فراهم مینماید. هدف این مقاله کاربرد و مطالعه روشهای یادگیری تقویتی در مدل چندعاملی بازار برق ایران و مقایسه آنها با دو استراتژی تصادفی و حریصانه است. در این مطالعه، میزان سود واحدها و زمان رسیدن به حالت تعادل به عنوان ملاک ارزیابی در نظر گرفته شده است. نتایج شبیه سازی نشان میدهد، استراتژی یادگیرنده سود عاملها را به طور معناداری افزایش میدهد و سرعت همگرائی به حالت تعادل را بیشتر میکند.
similar resources
معرفی یک شبیه ساز عامل محور برای بازار برق
در یک بازار برق واقعی، اطلاعات کاملی از رفتار رقبا در اختیار شرکت کنندگان بازار قرار ندارد. بدین ترتیب شرکت کنندگان بازار، تصمیم گیری های خود را بر مبنای اطلاعات موجود از قیمت بازار در گذشته انجام می دهند. در این مقاله، یک شبیه ساز جدید برای بازارهای همزمان انرژی و ذخیره چرخان ارائه می گردد که در آن فرآیند کسب تجربه و یادگیری شرکت کنندگان بازار با استفاده از یک روش یادگیری تقویتی مدلسازی شده اس...
full textیک روش ترکیبی جدید یادگیری تقویتی فازی
در این مقاله یک روش جدید یادگیری تقویتی پیوسته برای مسائل کنترل ارائه میشود. روش ارائه شده از ترکیب روش "تکرار سیاست کمترین مربعات " با یک سیستم فازی سوگنوی مرتبه صفر حاصل شده و "تکرار سیاست کمترین مربعات فازی" نامیده شده است. در اینجا برای هر قاعده فازی تعدادی عمل نامزد در نظر گرفته میشود. هدف، یافتن مناسبترین عمل نامزد (تالی) برای هر قاعده میباشد. با استفاده از بردار شدت آتش قواعد فازی و ...
full textروشی نوین برای یادگیری تقویتی فازیِ باناظر برای ناوبری ربات
: استفاده از یادگیری باناظر در ناوبری ربات های متحرک، با چالش های جدی از قبیل ناسازگاری و اختلال در داده ها، مشکل جمع آوری نمودن داده آموزش و خطای زیاد در داده های آموزشی مواجه می باشد. قابلیت های یادگیری تقویتی همچون عدم نیاز به داده آموزشی و آموزش تنها با استفاده از یک معیار اسکالر راندمان باعث کاربرد آن در ناوبری ربات شده است. از طرفی یادگیری تقویتی زمانبر بوده و دارای نرخ شکست های بالا در م...
full textشبیهسازی حراج پرداخت براساس پیشنهاد و حراج یکنواخت در بازار برق ایران: رهیافت الگوریتم تقویتی راث- ارو
طی سالهای پس از تجدید ساختار صنعت برق یکی از مهمترین چالشها، نوع حراج مورد استفاده در بازار برق تجدید ساختارشده بوده است. به صورت کلی، دو نوع حراج یکنواخت و پرداخت بر اساس پیشنهاد در بازارهای برق استفاده میشود. هدف از مطالعه حاضر، مقایسه حراج یکنواخت و حراج پرداخت بر اساس پیشنهاد با استفاده ار مدلسازی مبتنی بر عامل میباشد. بدین منظور، بر مبنای نظریههای اقتصاد و مدلسازی مبتنی بر عامل، با...
full textکاربرد روش یادگیری تقویتی برای تعیین دستورالعمل بهرهبرداری برحسب درخواست توزیع و تحویل بهینة آب
یکی از رویکردهای مؤثر تحویل و توزیع آب در شبکههای آبیاری روش برحسب درخواست است که با توجه به ساختار هر شبکه قابل اجراست؛ اما به استخراج دستورالعمل بهرهبرداری نیاز دارد. در این تحقیق، مدل تعیین دستورالعمل بهرهبرداری روش برحسب درخواست با الگوریتم یادگیری تقویتی سارسای فازی (FSL) توسعه داده شد و در کانال E1R1 شبکة آبیاری دز آزمون شد. ورودی این الگوریتم دبیهای درخواستشده و خروجی آن دستورالعمل...
full textMy Resources
Journal title
volume 7 issue 25
pages 1- 40
publication date 2018-09-11
By following a journal you will be notified via email when a new issue of this journal is published.
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023